MCAP: Perfilado de capa en tiempo de implementación para inferencia LLM restringida por memoria Optimiza el perfilado de capas para inferencia LLM con restricción de memoria, mejorando la eficiencia y precisión del proceso. 2026-04-27 · 2 min